30 research outputs found

    Databases of homologous gene families for comparative genomics

    Get PDF
    International audienceBackground: Comparative genomics is a central step in many sequence analysis studies, from gene annotation and the identification of new functional regions in genomes, to the study of evolutionary processes at the molecular level (speciation, single gene or whole genome duplications, etc.) and phylogenetics. In that context, databases providing users high quality homologous families and sequence alignments as well as phylogenetic trees based on state of the art algorithms are becoming indispensable. Methods: We developed an automated procedure allowing massive all-against-all similarity searches, gene clustering, multiple alignments computation, and phylogenetic trees construction and reconciliation. The application of this procedure to a very large set of sequences is possible through parallel computing on a large computer cluster. Results: Three databases were developed using this procedure: HOVERGEN, HOGENOM and HOMOLENS. These databases share the same architecture but differ in their content. HOVERGEN contains sequences from vertebrates, HOGENOM is mainly devoted to completely sequenced microbial organisms, and HOMOLENS is devoted to metazoan genomes from Ensembl. Access to the databases is provided through Web query forms, a general retrieval system and a client-server graphical interface. The later can be used to perform tree-pattern based searches allowing, among other uses, to retrieve sets of orthologous genes. The three databases, as well as the software required to build and query them, can be used or downloaded from the PBIL (PĂ´le Bioinformatique Lyonnais) site at http://pbil.univ-lyon1.fr/

    Développements d'outils pour l'aide à l'identification dans les grandes banques de familles de gènes

    No full text
    Le nombre de séquences génomiques disponibles augmente très vite du développement de méthodes de séquençage massif. La classification de ces séquences est nécessaire et permet l'étude de leurs relations évolutives. Des outils bioinformatiques automatisés sont indispensables pour effectuer ces opérations d'identification de façon précise et rapide. Nous avons développé HoSeqI (Homologous Sequence Identification), un système permettant d'automatiser l'identification de séquences dans de grandes banques de familles de gènes homologues. HoSeqI propose une interface accessible sur internet (http://pbil.univ-lyon1.fr/software/HoSeqI/) afin d'identifier une séquence et de visualiser l'alignement et la phylogénie obtenus. Un autre programme, dérivé d'HoSeqI, a été implémenté pour l'ajout automatique de séquences génomiques aux banques de familles. Enfin, un travail sur l'identification automatique de séquences bactériennes d'ARN 16S et la détection de séquences chimères a été effectuéLYON1-BU.Sciences (692662101) / SudocSudocFranceF
    corecore